iT邦幫忙

2023 iThome 鐵人賽

DAY 3
0

強化學習(Reinforcement Learning)

強化學習是機器學習其中的一個部份,主要是說人工智慧在一個還不斷的互動嘗試,做出決策來最佳化目標的完成。這在許多需要隨時制定決策的很多領域中都有應用,像是自動駕駛、遊戲玩法、機器人控制、金融交易和醫學治療等。


強化學習的概念大概可以分為幾個要素:

  1. 主體(agent): 與環境進行互動的AI本體。
  2. 環境(environment): 主體進行操作的地方,例如棋盤上的棋子位置、遊戲中的場景座標等等。
  3. 動作(action): 主體執行的操作決策。
  4. 狀態(state): 主體在環境中某一時間點的訊息。
  5. 獎勵(reward): 主體在進行操作後由環境反饋的數值,獎勵的優劣取決於主體操作的好壞。
  6. 策略(policy): 指導主體做出動作的一個算法,通常以最大化獎勵為目標。

大致上的關係是,

主體 (Agent) 與環境 (Environment) 接觸互動,去感知環境的狀態 (States) 並選擇採取什麼動作 (Actions)。
主體採取動作後,環境通過進行動作後的獎勵 (Rewards) 提供反饋,告訴主體它的行動的好壞。
主體會用策略 (Policy) 來制定動作的決策,目標是經過一連串的互動,獲得最大的累積獎勵。

以下是自己畫的簡略關係圖
https://ithelp.ithome.com.tw/upload/images/20230918/20160630BLKXhvz2c0.png


上一篇
Day2 人工智慧介紹
下一篇
Day4 機器學習: 監督式學習(Supervised Learning)
系列文
AI語音模型訓練: machine learning 和 deep learning 的學習與應用30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言